هوشمندسازی| فناوری پردازش گفتار به شناخت پیکرههای زبان فارسی کمک میکند
دستیارهای هوش مصنوعی در حوزه تشخیص یا به عبارت دیگر پردازش گفتار نقش پررنگی ایفا میکنند.
با توجه به ظرفیت فراوان تجاریسازی و کاربردهای متنوع این فناوری، در سالیان اخیر، حمایت از توسعه و پیشرفت دانش تشخیص گفتار انسان با ماشین، به یکی ضرورت در داخل کشور تبدیل شده است.
تشخیص گفتار یا تشخیص گفتار خودکار، فرآیندی است که طی آن، ماشین میتواند کلام و گفتار را گوش کرده و آن را پردازش کند، یا به طور مثال آن را تبدیل به متن کند.
به گفته امیر شریفیان مدیر مرکز رصد و ترویج اقتصاد دیجیتال، قدرت پیشبینی و یادگیری بینظیر یادگیری عمیق توانسته به ماشینها در راه پیشرفت روزافزون در زمینه تشخیص گفتار، کمکهای شایانتوجهی کند. دو راهکار تست این ویژگی ماشینها از سایر راهکارها، بسیار پرکاربردتر است.
Librispeech راهکار اول است که به تخمین قدرت تشخیص کامپیوترها در تبدیل گفتار به متن در فرکانسهای مختلف صدایی میپردازد.
راهکار دوم، VoxCeleb است که وظیفه آن، انتخاب شخص گوینده گفتار است. ماشینها به کمک یادگیری عمیق در سالیان گذشته، در هر دو زمینه، پیشرفتهای بسیاری کردهاند.
خطای پائینتر از یک درصد
نرخ تعداد اشتباهات در تشخیص صدای افراد معروف در 4 سال گذشته، از حدود 8 درصد در سال 2016 به زیر 1 درصد در سال 2020 رسیده است.
این افزایش چشمگیر دقت، به لطف استفاده از الگوریتمهای هیبرید و دوگانه متشکل از یادگیری عمیق و راهکارهای الگوریتمیک بسیار پیچیدهتر به دست آمده است.
توسعه پردازش گفتار در کشور
از آن جا که وجود پیکرهها و دیتاستهای زبان فارسی میتواند تا حدود زیادی، عرصه را برای توسعه ابزارهای مختلف در این زمینه مهیا کند، ستاد توسعه اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاستجمهوری در تلاش است تا با همکاری برخی از توانمندترین شرکتهای هوش مصنوعی کشور اقدام به ایجاد پیکرههای منبع باز برای این حوزه کند.
به طور مثال پروژه نوآوری در پیکره فناوری گفتگوی روزمره زبان فارسی که از مرداد ماه سال 99 آغاز شده است، در مراحل پایانی قرارداد و بهزودی در دسترس فناوران قرار خواهد گرفت. در حال حاضر یکی دیگر از مشکلات عمده این سیستمها، توانایی پایین در تشخیص لهجهها است.
تاکنون سیستمها و نرمافزارهای متعددی در کشور، با هدف برقراری ارتباط انسان و ماشین طراحی و به بازار عرضه شده که گام بلندی در توسعه دانش تشخیص گفتار یا تشخیص گفتار خودکار به حساب آمده و چشمانداز شاخصهای فناوریهای مربوط به هوش مصنوعی ایران را با رونق همراه کرده است.
از جمله محصولات توانمند داخلی در زمینه پردازش گفتار میتوان به تایپو آوای، آیاو تایپ، بیانک، پکتوس، طنینو، دروازههای نوین پارس و دستیار صوتی دابی اشاره کرد.
مرکز ارتباطات و اطلاعرسانی معاونت علمی و فناوری ریاست جمهوری
#17
Send to friends